import time
import PyPDF2
from docx import Document

while True:

    print('请输入pdf文档完整路径（例子：E:\BaiduNetdiskDownload\你好.pdf）：', end='')
    pdf_path = input()

    try:
        open_pdf = open(pdf_path, 'rb')

        read_pdf = PyPDF2.PdfReader(open_pdf)

        get_pdf_pages = len(read_pdf.pages)

        text = ''

        for get_pdf_page in range(get_pdf_pages):
            page = read_pdf.pages[get_pdf_page]
            text += page.extract_text()



        # 新建一个 Word 文档
        doc = Document()

        # 将文本添加到 Word 文档中
        doc.add_paragraph(text)

        # 获取用户输入的文件名，不包括路径
        pdf_file_name = pdf_path.split('\\')[-1]  # 使用 / 分隔符，兼容 Windows 和 Unix 系统
        pdf_base_name = pdf_file_name.split('.')[0]  # 去掉扩展名

        # 指定保存 .docx 文件的完整路径和名称
        output_dir = "D:/test/"  # 替换为您的实际输出目录
        output_file_name = f"{pdf_base_name}_转换.docx"
        output_path = output_dir + output_file_name

        # 保存 Word 文档到指定目录
        doc.save(output_path)
        print('提取好了去查收吧')
        open_pdf.close()



    except FileNotFoundError:
        print(f"无法找到文件: {pdf_path}")
